Guida al Programming CUDA: La Transizione verso un Calcolo Orientato alla Throughput

L'elaborazione ha subito un cambiamento fondamentale da ottimizzato per la latenza progettazione CPU a orientato alla throughput architetture GPU. Mentre una CPU è come una moto rapida per la consegna (veloce per un solo pacco), una GPU è una nave mercantile gigantesca: si muove più lentamente per singolo elemento ma trasporta 50.000 container contemporaneamente.

1. Latenza vs. Throughput

Le CPU sono progettate per minimizzare il "tempo di completamento" per una singola sequenza di istruzioni utilizzando una previsione di ramificazione sofisticata. Al contrario, Unità di Elaborazione Grafica (GPU) sono progettate per massimizzare il "lavoro al secondo" eseguendo migliaia di thread in parallelo, sacrificando la velocità del singolo thread per una throughpu massiva complessiva.

2. Assegnazione dei Transistor

Una GPU offre una throughpu di istruzioni e una larghezza di banda della memoria molto superiori rispetto a una CPU all'interno di un simile contesto di prezzo e potenza. Le GPU sono specializzate in calcoli altamente paralleli e dedicano più transistor alle unità di elaborazione dati (ALU), mentre le CPU dedicano più transistor alla memorizzazione temporanea dei dati e al controllo del flusso.

3. L'Evoluzione di CUDA

Architettura Unificata per l'Elaborazione (CUDA) è stata introdotta da NVIDIA nel 2006. È una piattaforma e un modello di programmazione parallela che consente aumenti significativi delle prestazioni sfruttando il potere della GPU indipendentemente dalle API grafiche.

TERMINALbash — 80x24

> Ready. Click "Run" to execute.

QUESTION 1

Which component consumes the majority of silicon real estate in a traditional CPU?

Arithmetic Logic Units (ALUs)

Control logic and Data Caching

Floating Point Units

Memory Controllers

QUESTION 2

What was the original purpose of the GPU before CUDA?

General purpose scientific computing

Operating system kernel management

Fixed-function hardware for 3D rendering

High-frequency trading

QUESTION 3

In the cargo ship analogy, what represents the 'Throughput'?

The speed at which the ship moves across the ocean.

The total volume of containers delivered at once.

The size of the ship's engine.

The fuel efficiency per container.

QUESTION 4

What is the primary trade-off made by GPUs to achieve high aggregate throughput?

Higher power consumption per unit.

Lower single-thread performance.

Reduced memory bandwidth.

Simplified mathematical precision.

QUESTION 5

Which NVIDIA software component is required to run CUDA applications?

DirectX 12

NVIDIA Driver and CUDA Toolkit

OpenGL Wrapper

Windows GDI+